setwd("C:/Users/ruam_/OneDrive/Mestrado/Disciplinas/Analise de Dados/Trabalho Final/Trabalho_Final_AD")


# Gerando coluna com os meses/ano 


meses_ano <- c ("jul/2016", "ago/2016", "set/2016", "out/2016", "nov/2016", "dez/2016", "jan/2017",
               "fev/2017", "mar/2017", "abr/2017", "mai/2017", "jun/2017", "jul/2017", "ago/2017", "set/2017",
               "out/2017", "nov/2017", "dez/2017", "jan/2018", "fev/2018", "mar/2018", "abr/2018",
               "mai/2018", "jun/2018", "jul/2018", "ago/2018", "set/2018", "out/2018", "nov/2018",
               "dez/2018")


# Gerando a coluna com a variável Letalidade violenta

letalidade_violenta <- c(369, 367, 409, 450, 444, 467, 488, 494, 514, 417, 442,
                         419, 372, 379, 470, 485, 487, 413, 509, 423, 494, 462,
                         445, 437, 416, 443, 381, 402, 394, 346)

letalidade_violenta


# Gerando a coluna com a variável apreensão de drogas

apreensao_de_drogas <- c(2221, 2148, 2057, 1888, 1901, 2029, 1704, 1266, 1706, 1814,
                         1862, 1864, 1791, 1887, 1852, 1887, 1894, 1785, 1793, 1588,
                         1744, 1857, 1966, 1809, 1880, 1994, 1959, 1735, 1716, 1585)

apreensao_de_drogas

# Gerando a coluna com a variável número de tiroteios

numero_tiroteios <- c(748, 349, 508, 348, 360, 212, 317, 318, 552, 356, 476,
                      657, 589, 571, 571, 566, 503, 516, 691, 684, 783, 773,
                      902, 834, 824, 1014, 877, 829, 695, 687)

numero_tiroteios

 
# Gerando a coluna com a variável mortes por tiroteio

mortes_tiroteio <- c(80, 73, 110, 98, 104, 73, 115, 128, 158, 76, 131, 112,
                     85, 112, 123, 143, 159, 122, 147, 123, 163, 119, 107, 125,
                     107, 140, 102, 109, 122, 86)

mortes_tiroteio

# Gerando a coluna com a variável intervenção federal

intervencao_federal <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
                         0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1)

intervencao_federal

# Criando a base de dados

dados <- data.frame(meses_ano, letalidade_violenta, apreensao_de_drogas, numero_tiroteios,
                    mortes_tiroteio, intervencao_federal)

# Salvando a base de dados em Rdata

save(dados, file = "dados.RData")

# Observando a base de dados

View(dados)

# Carregando pacotes para uso durante a análise e trabalho com os dados

# Carrgando pacotes necessários
if(require(ggplot2) == F) install.packages("ggplot2"); require(ggplot2)
if(require(readxl) == F) install.packages("readxl"); require(readxl)
if(require(DataExplorer) == F) install.packages("DataExplorer"); require(DataExplorer)
if(require(dplyr) == F) install.packages("dplyr"); require(dplyr)
if(require(rio) == F) install.packages("rio"); require(rio)
if(require(ggiraphExtra) == F) install.packages('ggiraphExtra'); require(ggiraphExtra)
if(require(modelr) == F) install.packages('modelr'); require(modelr)
install.packages("texreg")
library(texreg)
install.packages("modelsummary")
library(modelsummary)
require(modelsummary)
install.packages("gridExtra")
library(gridExtra)
install.packages("ggstance")
library("ggstance")
install.packages("jtools")
library(jtools)

options(scipen = 999)
options(stringsAsFactors = FALSE)



# Análise exploratória dos dados 

View(dados)
summary(dados$letalidade_violenta) 
summary(dados$intervenção_federal) 
summary(dados$mortes_tiroteio) 
summary(dados$numero_tiroteios) 
summary(dados$apreensão_de_drogas)
sd(dados$letalidade_violenta)
sd(dados$intervenção_federal)
sd(dados$mortes_tiroteio)
sd(dados$numero_tiroteios)
sd(dados$apreensão_de_drogas)
class(dados)
head(dados)

# Dados da base

plot_str(dados)

# Análise do que não está sendo observado

plot_missing(dados)

# Histograma dos dados

plot_histogram(dados)

# Análise gráfica da densidade dos gráficos

plot_density(dados)

# Tabela de correlação dos dados

plot_correlation(dados, 
                 type = 'continuous',
                 'Review.Date')




# Conferindo o grau de relação da intervençã federal com as outras variáveis a partir do teste de 
# médias

t.test(dados$letalidade_violenta ~ factor(dados$intervencao_federal))

t.test(dados$numero_tiroteios ~ factor(dados$intervencao_federal))

t.test(dados$mortes_tiroteio ~ factor(dados$intervencao_federal))

t.test(dados$apreensao_de_drogas ~ factor(dados$intervencao_federal))


# Rodando diferentes modelos de regressão

#Regressão 1

reg1 <- lm(letalidade_violenta~factor(intervencao_federal) + numero_tiroteios + 
             apreensao_de_drogas + mortes_tiroteio, data = dados)

summary(reg1)

plot(reg1)

confint(reg1)

rmse(reg1, dados)

screenreg(reg1)

#Regressão 2

reg2 <- lm(letalidade_violenta~factor(intervencao_federal), data = dados)

summary(reg2)

plot(reg2)

confint(reg2)

rmse(reg2, dados)

screenreg(reg2)

#Regressão 3

reg3 <- lm(letalidade_violenta~mortes_tiroteio, data = dados)

summary(reg3)

plot(reg3)

confint(reg3)

rmse(reg3, dados)

screenreg(reg3)

#Regressão 4

reg4 <- lm(letalidade_violenta~numero_tiroteios, data = dados)

summary(reg4)

plot(reg4)

confint(reg4)

rmse(reg4, dados)

screenreg(reg4)

#Regressão 5

reg5 <- lm(letalidade_violenta~apreensao_de_drogas, data = dados)

summary(reg5)

plot(reg5)

confint(reg5)

rmse(reg5, dados)

screenreg(reg5)

# Gerando tabela única de todas as regressões 

library(devtools)
devtools::install_github("rstudio/gt")

models <- list()
models[['reg1']] <- lm(letalidade_violenta~factor(intervencao_federal) + numero_tiroteios + 
                         apreensao_de_drogas + mortes_tiroteio, data = dados)
models[['reg2']] <- lm(letalidade_violenta~factor(intervencao_federal), data = dados)
models[['reg3']] <- lm(letalidade_violenta~mortes_tiroteio, data = dados)
models[['reg4']] <- lm(letalidade_violenta~numero_tiroteios, data = dados)
models[['reg5']] <- lm(letalidade_violenta~apreensao_de_drogas, data = dados)

msummary(models, 
         title = 'Tabela.',
         notes = '* p < 0.001; ** p < 0.01; * p < 0.05.',
         stars = TRUE,
         stars_note = FALSE)

# Gerando gráfico da regressão

plot_summs(reg1, reg2, reg3, reg4, reg5, scale = TRUE, inner_ci_level = .9,
           model.names = c("Modelo 1", "Modelo 2", "Modelo 3", "Modelo 4", "Modelo 5"))

# Analisando graficamente a relação entre as variáveis intervenção federal e todas as outras

boxplot1 <- ggplot(dados, aes(factor(intervencao_federal),letalidade_violenta)) + 
  labs(x = "Intervenção Federal", y ="Letalidade", title = "Boxplot") +
  geom_boxplot() 
  


boxplot2 <- ggplot(dados, aes(factor(intervencao_federal), apreensao_de_drogas)) + 
  labs(x = "Intervenção Federal", y ="Apreensão de Drogas", title = "Boxplot") +
  geom_boxplot() 
  


boxplot3 <- ggplot(dados, aes(factor(intervencao_federal),numero_tiroteios)) + 
  labs(x = "Intervenção Federal", y ="Número de Tiroteios", title = "Boxplot") +
  geom_boxplot() 



boxplot4 <- ggplot(dados, aes(factor(intervencao_federal),mortes_tiroteio)) + 
  labs(x = "Intervenção Federal", y ="MOrtes por tiroteio", title = "Boxplot") +
  geom_boxplot() 

grid.arrange(boxplot1, boxplot2, boxplot3, boxplot4)




